مقدمه مترجمین/ ۱۵
پیشگفتار/ ۱۷
چرا اکنون این کتاب را نوشتیم؟ /۱۸
این کتاب چگونه سازماندهی شده است /۱۹
استفاده از نمونه کد /۲۱
قدردانی ها/ ۲۳
فصل ۱: تجزیه و تحلیل دادههای بزرگ /۲۵
کار با دادههای بزرگ/ ۲۷
معرفی آپاچیاسپارک و پایاسپارک /۳۰
اجزاء اسپارک /۳۰
مقایسه با (MapReduce )/۳۱
(PySpark) /۳۲
زیستبوم/ ۳۴
اسپارک ۰/۳ ۳۵
پایاسپارک به چالشهای علم داده میپردازد/ ۳۶
از اینجا کجا برویم /۳۸
فصل ۲: مقدمهای بر تجزیه و تحلیل دادهها با پایاسپارک/ ۳۹
(DataFrame) و (RDDs)/۴۱
معماری اسپارک/ ۴۲
در حال نصب پایاسپارک/ ۴۴
تنظیم داده های ما /۴۷
تجزیه و تحلیل داده ها با دیتافریم ایپیای/ ۵۵
آمار خلاصه سریع برای دیتافریمز /۶۱
چرخش و تغییر شکل دیتافریم/ ۶۳
امتیازدهی و ارزیابی مدل/ ۶۸
از اینجا کجا برویم/ ۷۱
فصل ۳: توصیه موسیقی و مجموعه داده موسیقی (Audioscrobbler )/۷۳
تنظیم دادهها ۷۴
الزامات ما برای یک سامانه پیشنهاددهنده/ ۷۷
الگوریتم حداقل مربعات متناوب /۸۱
آماده سازی داده ها /۸۳
ساخت اولین مدل/ ۸۶
توصیههای بررسی نقطه ای/ ۹۱
ارزیابی کیفیت توصیه /۹۴
AUC محاسباتی/ ۹۶
انتخاب فراپارامتر/ ۹۸
ارائه توصیه ها /۱۰۲
از اینجا کجا برویم /۱۰۳
فصل ۴: پیشبینی با درختان تصمیم و جنگل های تصمیم/ ۱۰۵
درختان و جنگل های تصمیم/ ۱۰۶
آمادهسازی داده ها /۱۱۱
اولین درخت تصمیم ما /۱۱۶
فراپارامترهای درخت تصمیم /۱۲۵
تنظیم درختان تصمیم/ ۱۲۸
بازبینی ویژگیهای دسته بندی/ ۱۳۴
جنگل های تصادفی/ ۱۳۸
پیشگویی/ ۱۴۱
از اینجا کجا برویم /۱۴۲
فصل ۵: تشخیص ناهنجاری با (K-means Clustering )/۱۴۵
K- به معنای خوشه بندی است/ ۱۴۷
شناسایی ترافیک شبکه غیرعادی/ ۱۴۸
مجموعه داده KDD Cup)( ۱۹۹۹) )
اولین برداشت در مورد خوشه بندی/ ۱۵۱
انتخاب (k )/۱۵۴
تجسم با(spark R )/۱۵۸
نرمالسازی ویژگی ها/ ۱۶۴
متغیرهای طبقه بندی شده/ ۱۶۷
استفاده از برچسب ها با آنتروپی /۱۶۸
خوشه بندی در عمل/ ۱۷۱
از اینجا کجا برویم/ ۱۷۲
فصل ۶: آشنایی با ویکی پدیا با LDA و (SPARK NLP )/۱۷۵
تخصیص دیریکله نهفته/ ۱۷۶
LDA در (pyspark )/۱۷۷
دریافت داده ها/۱۷۸
اسپارک ان آل پی/ ۱۸۰
تنظیم محیط/ ۱۸۱
تجزیه داده ها/ ۱۸۲
آمادهسازی داده ها با استفاده از اسپارک انالپی /۱۸۴
(TF-IDF )/۱۸۹
محاسبه (TF-IDFs)/۱۹۰
ایجاد مدل (LDA )/۱۹۱
از اینجا کجا برویم/ ۱۹۵
فصل ۷: تجزیه و تحلیل داده های مکانی و زمانی در داده های سفر تاکسی /۱۹۷
آماده سازی داده ها/ ۲۰۰
تبدیل رشته های زمان تاریخ به مهر زمانی /۲۰۲
رسیدگی به سوابق نامعتبر/ ۲۰۵
تجزیه و تحلیل جغرافیایی/ ۲۰۷
معرفی ژئوجیسون/ ۲۰۷
ژئوپانداها /۲۰۹
Sessionization در پایاسپارک/ ۲۱۳
Building Sessions: Secondary Sorts در پایاسپارک /۲۱۴
از اینجا کجا برویم/ ۲۱۸
فصل ۸: تخمین ریسک مالی /۲۲۱
واژه شناسی/ ۲۲۳
روش های محاسبه (VaR )/۲۲۴
واریانس-کوواریانس /۲۲۴
شبیه سازی تاریخی/ ۲۲۴
شبیه سازی مونتکارلو/ ۲۲۴
مدل ما/ ۲۲۵
دریافت داده ها/ ۲۲۷
آمادهسازی داده ها/ ۲۲۸
تعیین وزن عوامل /۲۳۱
نمونه برداری/ ۲۳۶
توزیع نرمال چند متغیره/ ۲۳۸
اجرای آزمایشی/ ۲۳۹
تجسم توزیع بازده /۲۴۴
از اینجا کجا برویم /۲۴۵
فصل ۹: تجزیه و تحلیل دادههای ژنومیک و پروژه( BDG )/۲۴۷
جداسازی فضای ذخیره سازی از مدلسازی/ ۲۴۹
راه اندازی (ADAM )/۲۵۳
مقدمه ای بر کار با داده های ژنومیک با استفاده از (ADAM )/۲۵۴
تبدیل فرمت فایل با (ADAM CLI )/۲۵۵
بلع داده های ژنومیک با استفاده از پایاسپارک و آدام /۲۵۶
پیشبینی سایت های اتصال فاکتور رونویسی از داده های/ ۲۶۲
از اینجا کجا برویم /۲۶۹
فصل ۱۰: تشخیص شباهت تصویر با یادگیری عمیق و (PySpark LSH)/۲۷۱
(PyTorch )/۲۷۲
نصب و راه اندازی/ ۲۷۳
آمادهسازی داده ها/۲۷۴
تغییر اندازه تصاویر با استفاده از (PyTorch )/۲۷۵
مدل یادگیری عمیق برای نمایش برداری تصاویر/ ۲۷۶
جاسازی های تصویر/ ۲۷۶
جاسازیهای تصویر را به پایاسپارک وارد کنید/ ۲۷۹
جستجوی شباهت تصویر با استفاده از پایاسپارک( LSH )/۲۸۱
جستجوی نزدیکترین همسایه /۲۸۲
از اینجا کجا برویم /۲۸۵
فصل ۱۱: مدیریت یادگیری ماشینی - چرخه حیات با (MLflow )/۲۸۷
چرخه زندگی یادگیری ماشینی /۲۸۸
عدم تکرارپذیری /۲۸۹
استاندارد نبودن مدل ها /۲۸۹
(MLflow)/۲۸۹
ردیابی (MLflow)/۲۹۰
پروژه های (MLflow)/۲۹۰
مدل های (MLflow )/۲۹۰
رجیستری (MLflow )/۲۹۰
ردیابی آزمایش /۲۹۱
مدیریت و ارائه مدل های (ML )/۲۹۵
درخواست نصب (pip۳ )/۲۹۸
ایجاد و استفاده از پروژه های امالفلاو /۲۹۹
از اینجا کجا برویم/ ۳۰۳
فهرست کلمات /۳۰۵
کولوفون/ ۳۲۳
دسته بندی موضوعی | موضوع فرعی |
فنی و مهندسی |
مهندسی كامپيوتر
|